Classification incrémentale supervisée : un panel introductif

نویسندگان

  • Christophe Salperwyck
  • Vincent Lemaire
چکیده

Résumé. Les dix dernières années ont été témoin du grand progrès réalisé dans le domaine de l’apprentissage statistique et de la fouille de données. Il est possible à présent de trouver des algorithmes d’apprentissage efficaces et automatiques. Historiquement les méthodes d’apprentissage faisaient l’hypothèse que toutes les données étaient disponibles et pouvaient être chargées en mémoire pour réaliser l’apprentissage. Mais de nouveaux domaines d’application de la fouille de données émergent telles que : la gestion de réseaux de télécommunications, la modélisation des utilisateurs au sein d’un réseau social, le web mining... La volumétrie des données explose et il est nécessaire d’utiliser des algorithmes d’apprentissage incrémentaux. Cet article a pour but de présenter les principales approches de classification supervisée incrémentale recensées dans la littérature. Il a pour vocation de donner à un lecteur débutant des indications de lecture sur ce sujet; sujet qui connaît déjà des applications industrielles.

منابع مشابه

Classification dynamique d'un flux documentaire : une évaluation statique préalable de l'algorithme GERMEN

Data-stream clustering is an ever-expanding subdomain of knowledge extraction. Most of the past and present research effort aims at efficient scaling up for the huge data repositories. Our approach focuses on qualitative improvement, mainly for “weak signals” detection and precise tracking of topical evolutions in the framework of information watch – though scalability is intrinsically guarante...

متن کامل

Clustering dynamique d'un flot de données: un algorithme incrémental et optimal de détection des maxima de densité

Résumé. L’extraction non supervisée et incrémentale de classes sur un flot de données (data stream clustering) est un domaine en pleine expansion. La plupart des approches visent l’efficacité informatique. La nôtre, bien que se prêtant à un passage à l’échelle en mode distribué, relève d’une problématique qualitative, applicable en particulier au domaine de la veille informationnelle : faire ap...

متن کامل

Combinaison de classification supervisée, non-supervisée par la théorie des fonctions de croyance

Résumé. Nous proposons dans cet article une nouvelle approche de classification fondée sur la théorie des fonctions de croyance. Cette méthode repose sur la fusion entre la classification supervisée et la classification non supervisée. En effet, nous sommes face à un problème de manque de données d’apprentissage pour des applications dont les résultats de classification supervisée et non superv...

متن کامل

Une nouvelle méthode divisive de classification non supervisée pour des données symboliques intervalles

Résumé. Dans cet article nous présentons une nouvelle méthode de classification non supervisée pour des données symboliques intervalles. Il s’agit de l’extension d’une méthode de classification non supervisée classique à des données intervalles. La méthode classique suppose que les points observés sont la réalisation d’un processus de Poisson homogène dans k domaines convexes disjoints de R. La...

متن کامل

La Classification non Supervisée (Clustering) de Documents Textuels par les Automates Cellulaires

Résumé : Dans cet article nous présentons un automate cellulaire (Class_AC) pour résoudre un problème de text mining en l’occurrence la classification non supervisée (Clustering). Avant de procéder à l’expérimentation par l’automate cellulaire, nous avons vectorisés nos données en procédant à l’indexation des documents textuels provenant de la base de donnée REUTERS 21578 par l’approche Wordnet...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

متن کامل
عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010